Fechar

@AudiovisualMaterial{Rodrigues:2020:DeLeHa,
             abstract = "A {\'a}rea de sensoriamento remoto (SR) para 
                         observa{\c{c}}{\~a}o da Terra tem experimentado um grande 
                         desenvolvimento na {\'u}ltima d{\'e}cada. O acr{\'e}scimo 
                         consider{\'a}vel do n{\'u}mero de sensores a{\'e}reos e 
                         orbitais, assim como a evolu{\c{c}}{\~a}o tecnol{\'o}gica 
                         empregada nesses equipamentos, causou um aumento expressivo do 
                         volume de dados gerados, inaugurando um novo paradigma o Remote 
                         Sensing Big Data (RSBD). Nesse contexto, uma das {\'a}reas de 
                         maior desafio {\'e} a de sistemas de busca e 
                         recupera{\c{c}}{\~a}o de imagens baseadas em conte{\'u}do 
                         (Content-Based Image Retrieval CBIR). Tais sistemas empregam um 
                         grande n{\'u}mero de descritores (vetor de atributos) de alta 
                         dimens{\~a}o, onde a busca exaustiva {\'e} invi{\'a}vel devido 
                         ao custo computacional. Para enfrentar esse problema duas 
                         estrat{\'e}gias podem ser adotadas: i) melhorar os m{\'e}todos 
                         de busca; ii) reduzir a dimens{\~a}o dos descritores de 
                         atributos. Ultimamente, tem ganhado destaque na comunidade 
                         cient{\'{\i}}fica m{\'e}todos de Hash profundo, ou seja, 
                         m{\'e}todos que empregam redes neurais profundas para executar a 
                         extra{\c{c}}{\~a}o de atributos de imagens e gera{\c{c}}{\~a}o 
                         de c{\'o}digos bin{\'a}rios (Hash Codes) atrav{\'e}s de 
                         aprendizagem simult{\^a}nea. Basicamente, durante o processo de 
                         aprendizagem os m{\'e}todos mapeiam vetores de alta dimens{\~a}o 
                         para um espa{\c{c}}o de atributos de baixa dimens{\~a}o 
                         conhecido como Hamming Space, onde os atributos das imagens 
                         s{\~a}o representados por Hash Codes que reduzem tanto 
                         complexidade computacional da busca e recupera{\c{c}}{\~a}o 
                         quanto o espa{\c{c}}o de mem{\'o}ria necess{\'a}rio para 
                         representa{\c{c}}{\~a}o do conte{\'u}do das imagens, aumentando 
                         assim a efici{\^e}ncia dessas tarefas. Nesse contexto, esse 
                         trabalho apresenta uma abordagem para CBIR no escopo do RSBD 
                         baseada na Metric-Learning based Deep Hashing Network (MiLaN). A 
                         MiLaN emprega {\`a} Inception V3, rede convolucional profunda, 
                         pr{\'e}-treinada com o conjunto de imagens ImageNet (benchmark de 
                         Vis{\~a}o Computacional), o objetivo {\'e} obter um m{\'o}dulo 
                         padr{\~a}o para extra{\c{c}}{\~a}o de atributos de imagens, que 
                         s{\~a}o convertidos em Hash Codes para compor o espa{\c{c}}o de 
                         atributos especializado para imagens de SR com base na 
                         fun{\c{c}}{\~a}o Triplet Loss proposta para o ajuste da MiLaN. O 
                         experimento foi conduzido sobre dois conjuntos de dados de SR: (i) 
                         UC Merced Land Use Dataset (UCMD) - conjunto de ortoimagens 
                         a{\'e}reas extra{\'{\i}}das da cole{\c{c}}{\~a}o de 
                         mapeamento de {\'a}reas urbanas dos Estados Unidos; (ii) UCMD e 
                         Landsat Center Pivot Images (LCPI) - criado a partir da 
                         combina{\c{c}}{\~a}o do UCMD e amostras de imagens de {\'a}reas 
                         com piv{\^o}s obtidas com o Landsat 8. Visando {\`a} 
                         caracteriza{\c{c}}{\~a}o de {\'a}reas de interesse 
                         cient{\'{\i}}fico como, por exemplo, agricultura, floresta ou 
                         irrigadas por piv{\^o}s, foram realizadas buscas baseadas em 
                         conte{\'u}do por meio do c{\'a}lculo de similaridade, utilizando 
                         dist{\^a}ncia de Hamming, para recupera{\c{c}}{\~a}o de imagens 
                         num conjunto de 2200 imagens, alcan{\c{c}}ando desempenho global 
                         (mean Average Precision - mAP) de 91.40%, conseguindo efetivamente 
                         recuperar imagens relevantes para as classes agricultura e 
                         floresta e nem t{\~a}o relevantes para a classe piv{\^o}s. 
                         Atrav{\'e}s do experimento realizado, foi poss{\'{\i}}vel 
                         demonstrar o potencial dessa abordagem para o desenvolvimento de 
                         sistemas CBIR que podem facilitar e viabilizar a busca por alvos, 
                         a fim de suportar {\`a} pesquisa de grupos tem{\'a}ticos como, 
                         por exemplo, SR para o monitoramento de {\'a}reas 
                         agr{\'{\i}}colas ou irrigadas por piv{\^o}s.",
          affiliation = "{Instituto Nacional de Pesquisas Espaciais (INPE)}",
               author = "Rodrigues, Marcos Lima",
                 city = "S{\~a}o Jos{\'e} dos Campos",
       conferencename = "Workshop dos Cursos de Computa{\c{c}}{\~a}o Aplicada do INPE, 20 
                         (WORCAP)",
                 date = "8-11 e 14-17 set. 2020",
             language = "pt",
                 note = "{(16 min)}",
            publisher = "Instituto Nacional de Pesquisas Espaciais (INPE)",
     publisheraddress = "S{\~a}o Jos{\'e} dos Campos",
                  ibi = "8JMKD3MGPDW34P/43HC4NE",
                  url = "http://urlib.net/ibi/8JMKD3MGPDW34P/43HC4NE",
           targetfile = "Deep Learning e hashing para CBIR de imagens de sensoriamento 
                         remoto - Marcos Lima Rodrigues.mp4",
                title = "Deep learning e hashing para Content-Based Image Retrieval (CBIR) 
                         de imagens de sensoriamento remoto",
                 type = "tecnologia da informa{\c{c}}{\~a}o",
                 year = "2020",
        urlaccessdate = "19 maio 2024"
}


Fechar